[Python] Pandas df.iterrow 平行處理

pyhton pandas multiprocessing

crowntail 2019-03-19 09:06:37 ‧ 4848 瀏覽

分享至

#import pakage
import pandas as pd
import multiprocessing

#指定主機有多少CPU，並把df 平均分配size
num_processes = multiprocessing.cpu_count()
chunk_size = int(df.shape[0]/num_processes)

#將df 拆解成 num_processes 個 chunk 的df list
chunks = [df.ix[df.index[i:i + chunk_size]] for i in range(0, df.shape[0], chunk_size)]

#定義 function
def myfunc(d):
   return d * d


pool = multiprocessing.Pool(processes=num_processes)
result = pool.map(myfunc, chunks)

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

[Python] Pandas df.iterrow 平行處理

尚未有邦友留言

標記使用者